iT邦幫忙

2024 iThome 鐵人賽

DAY 0
0
生成式 AI

除了ChatGPT,你了解生成式AI的其他應用嗎?30天從零到精通的學習與實作系列 第 4

Day 4 生成式AI的關鍵技術: 大型語言模型(LLM)(上)

  • 分享至 

  • xImage
  •  

大型語言模型(Large Language Model, LLM) 簡單來說

大型語言模型是一種利用大量文本資料訓練出來的人工智慧模型。當你給這個模型餵了大量的書籍、文章、網頁等文字資料,它就能學習這些文字的模式、語法、以及其中的知識,這彷彿就像一個博學多聞的人類一樣呢~

那具體來說,大型語言模型可以...

  1. 生成文字 : 根據使用者給予的指令,寫出各種風格的文章、創作劇本、故事,甚至程式碼。
  2. 翻譯、總結文章 : 將長篇大論的文章快速總結摘要、或是幫助快速翻譯文章。
  3. 回答問題 : 對使用者的問題提出相關的答案。

舉個例子,這是我叫Gemini幫我寫一首四言絕句的對答:
https://ithelp.ithome.com.tw/upload/images/20240918/201680052WRQ3U53rk.png

為什麼大型語言模型可以這麼厲害?

  1. 大量的資料: 它們接受了海量文本資料的訓練,掌握了豐富的知識。
  2. 預訓練與微調: 它們首先在大規模資料集上進行預訓練,學習語言的基本規則,然後透過少量特定資料進行微調,讓它們能夠適應不同任務的需求。
  3. 強大的計算能力: 它們需要強大的電腦來進行訓練和運算。

常見的大型語言模型有哪些?

  • GPT系列: 由OpenAI開發,在自然語言生成、對話、翻譯等方面表現出色,是目前最為知名的大型語言模型之一。
  • Gemini: 由Google DeepMind開發,是新一代的大型語言模型,結合了GPT和Transformer的優點,在多模態理解和生成方面表現出強大的能力。
  • LaMDA (Language Model for Dialogue Applications): 由Google AI開發,專注於對話生成,創造更自然、更開放的對話體驗。

今天簡單介紹了大型語言模型的功能應用與現在熱門的幾個模型,明天會講關於transformer模型的原理~


上一篇
Day 3 生成式AI的工作原理: 從AI、機器學習講到生成式AI的運作方式
下一篇
Day 5 生成式AI的關鍵技術: 大型語言模型(LLM)(下)
系列文
除了ChatGPT,你了解生成式AI的其他應用嗎?30天從零到精通的學習與實作12
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言